☰
11.4.3 역전파 가능한 계획: 미분 가능한 모델을 통한 직접적인 정책 그라디언트 전파
Home
/
인공지능 (Artificial Intelligence, AI)
/
제목: Embodied AI & Modern Control
/
Chapter 11. 세계 모델과 모델 기반 강화학습 (World Models & Model-Based RL)
/
11.4 계획(Planning)과 정책 최적화(Policy Optimization)
/
11.4.3 역전파 가능한 계획: 미분 가능한 모델을 통한 직접적인 정책 그라디언트 전파
11.4.3 역전파 가능한 계획: 미분 가능한 모델을 통한 직접적인 정책 그라디언트 전파